OCR 操作引用

您所在的位置:网站首页 power automat OCR 操作引用

OCR 操作引用

2024-07-12 21:31| 来源: 网络整理| 查看: 265

OCR 操作 项目 03/16/2023

Power Automate 使用户能够通过光学字符识别 (OCR) 读取、提取和管理文件中的数据。

要创建 OCR 引擎并从图像和文档中提取文本,请使用使用 OCR 提取文本操作。 以下示例从整个指定的图像提取文本。

所有 OCR 操作都可以创建新的 OCR 引擎变量或使用现有变量。 您可以在任何提供 OCR 功能的操作中使用现有的 OCR 引擎变量。

Power Automate 支持 Windows OCR 和 Tesseract 引擎。 要配置选定的 OCR 引擎,导航到相应操作的 OCR 引擎设置。 可用选项包括语言以及图像宽度和高度倍数。

备注

所有可用的 OCR 引擎都预装在 Power Automate 中,在本地工作,无需连接到云。 但是,您可能需要下载语言包或数据文件来提取特定语言的文本。 图像倍数可增加图像的大小,使搜索和文本提取更有效。 设置值大于 3 可能导致错误的结果。 使用 Windows OCR 引擎

Power Automate 中的默认 OCR 引擎是 Windows OCR 引擎。 要使用 Windows OCR 引擎提取文本,您必须为要提取的语言安装相应的语言包。

如果未安装相应的语言包,Power Automate 将引发错误,提示您安装。 要查找有关下载和安装语言包的详细信息,请转到 Windows 语言包。

安装相应的语言包后,展开 OCR 操作的 OCR 引擎设置,选择所需的语言。 Windows OCR 引擎支持 25 种语言,包括中文(简体和繁体)、捷克语、丹麦语、荷兰语、英语、芬兰语、法语、德语、希腊语、匈牙利语、意大利语、日语、韩语、挪威语、波兰语、葡萄牙语、罗马尼亚语、俄语、塞尔维亚语(西里尔文和拉丁语)、斯洛伐克语、西班牙语、瑞典语、土耳其语。

使用 Tesseract OCR 引擎

备注

要使用 Tesseract OCR 引擎,请确保计算机的 CPU 支持 AVX2 指令集。

除了 Windows OCR 引擎,Power Automate 还支持 Tesseract 引擎。 此引擎无需进一步配置即可提取五种语言的文本:英语、德语、西班牙语、法语和意大利语。

要以上述列表之外的语言提取文本,在 OCR 操作的 OCR 引擎设置中启用使用其他语言选项。 启用此选项后,操作会显示另外两个参数:语言缩写和语言数据路径。

语言缩写字段指示要在 OCR 期间查找的语言的引擎。 语言数据路径字段包含用于训练 OCR 引擎的语言数据文件 (.traineddata)。 您可以在此 GitHub 存储库中找到所有可用语言的语言数据文件。

您还可以使用 Tesseract 引擎从多语言文档中提取文本。 要查找有关从多语言文档中提取文本的详细信息,请转到对多语言文档执行 OCR。

如果文本显示在屏幕上(OCR)

根据给定文本是否显示在屏幕上,使用 OCR 标记条件操作块的开头。

输入参数 参数 可选 接受 默认值 说明 If text 不适用 存在、不存在 存在 指定是否检查用于分析的给定源中是否存在文本 OCR engine type 否 Windows OCR 引擎、Tesseract 引擎、OCR 引擎变量 OCR engine variable 要使用的 OCR 引擎类型。 选择预配置的 OCR 引擎或设置新引擎。 OCR engine variable 否 OCREngineObject 用于执行 OCR 操作的引擎 Text to find 否 文本值 要在指定源中搜索的文本 Is regular expression 不适用 布尔值 假 指定是否使用正则表达式查找指定文本 Search for text on 不适用 整个屏幕、前景窗口 整个屏幕 指定是在整个可视屏幕上还是仅在前景窗口中搜索指定文本 Search mode 不可用 整个指定源、仅限特定子区域、与图像相关的子区域 整个指定源 指定是扫描整个屏幕(或窗口)还是扫描缩小的屏幕子区域 图像 否 图像列表 指定用于扫描所提供文本的子区域(与图像的左上角相对应)的图像 X1 是 数值 用于扫描所提供文本的子区域的起始点 X 坐标 Tolerance 是 数值 10 指定搜索的图像可与最初选择的图像存在的区别程度 Y1 是 数值 用于扫描所提供文本的子区域的起始点 Y 坐标 X1 是 数值 与用于扫描所提供文本的指定图像相对应的子区域的起始点 X 坐标 X2 是 数值 用于扫描所提供文本的子区域的结束点 X 坐标 Y1 是 数值 与用于扫描所提供文本的指定图像相对应的子区域的起始点 Y 坐标 Y2 是 数值 用于扫描所提供文本的子区域的结束点 Y 坐标 X2 是 数值 与用于扫描所提供文本的指定图像相对应的子区域的结束点 X 坐标 Y2 是 数值 与用于扫描所提供文本的指定图像相对应的子区域的结束点 Y 坐标 Windows OCR 语言 不可用 中文(简体)、中文(繁体)、捷克语、丹麦语、荷兰语、英语、芬兰语、法语、德语、希腊语、匈牙利语、意大利语、日语、韩语、挪威语、波兰语、葡萄牙语、罗马尼亚语、俄语、塞尔维亚语(西里尔文)、塞尔维亚语(拉丁语)、斯洛伐克语、西班牙语、瑞典语、土耳其语 英语 Windows OCR 引擎检测到的文本语言 Use other language 不可用 布尔值 False 指定是否使用“Tesseract 语言”字段中未提供的语言 Tesseract language 不可用 英语、德语、西班牙语、法语、意大利语 英语 Tesseract 引擎检测到的文本语言 Language abbreviation 否 文本值 所用语言的 Tesseract 缩写。 例如,如果数据是“eng.traineddata”,则将此参数设置为“eng” Language data path 否 文本值 保存指定语言 Tesseract 数据的文件夹路径 Image width multiplier 否 数值 1 图像的宽度倍数 图像高度倍数 否 数值 1 图像的高度倍数 图像匹配算法 不适用 基本、高级 基本 搜索图像时要使用的图像算法

备注

Power Automate 的正则表达式引擎是 .NET。 要查找有关正则表达式的详细信息,请转到正则表达式语言 - 快速参考。 OCR 引擎变量选项已计划弃用。 生成的变量 参数 类型​​ 说明 LocationOfTextFoundX 数值 文本显示在屏幕上的相应点的 X 坐标。 如果搜索在前景窗口中执行,返回的坐标与窗口的左上角相对应 LocationOfTextFoundY 数值 文本显示在屏幕上的相应点的 X 坐标。 如果搜索在前景窗口中执行,返回的坐标与窗口的左上角相对应 异常 例外 说明 如果文本处于非交互模式,则无法进行检查 指示在非交互模式中无法检查屏幕上的文本 子区域坐标无效 指示指定的子区域坐标无效 未能使用 OCR 分析文本 指示尝试使用 OCR 分析文本时出错 未能创建 OCR 引擎 指示尝试创建 OCR 引擎时出错 数据路径文件夹不存在 指示为语言数据指定的文件夹不存在 计算机上未安装所选的 Windows 语言包 指示机器上尚未安装所选的 Windows 语言包 OCR 引擎不活动 指示 OCR 引擎未处于活动状态 等待屏幕上显示文本(OCR)

使用 OCR 等待特定文本在屏幕上、前景窗口中或在与图像相关的屏幕或前景窗口中显示/消失。

输入参数 参数 可选 接受 默认值 说明 Wait for text to 不适用 显示、消失 显示 指定是否等待文本显示或消失 OCR engine type 否 Windows OCR 引擎、Tesseract 引擎、OCR 引擎变量 OCR engine variable 要使用的 OCR 引擎类型。 选择预配置的 OCR 引擎或设置新引擎。 OCR engine variable 否 OCREngineObject 用于执行 OCR 操作的引擎 Text to find 否 文本值 要在指定源中搜索的文本 Is regular expression 不适用 布尔值 假 指定是否使用正则表达式查找指定文本 Search for text on 不适用 整个屏幕、前景窗口 整个屏幕 指定是在整个可视屏幕上还是仅在前景窗口中搜索指定文本 Search mode 不可用 整个指定源、仅限特定子区域、与图像相关的子区域 整个指定源 指定是扫描整个屏幕(或窗口)还是扫描缩小的屏幕子区域 图像 否 图像列表 指定用于扫描所提供文本的子区域(与图像的左上角相对应)的图像 X1 是 数值 用于扫描所提供文本的子区域的起始点 X 坐标 Tolerance 是 数值 10 指定搜索的图像可与最初选择的图像存在的区别程度 Y1 是 数值 用于扫描所提供文本的子区域的起始点 Y 坐标 X1 是 数值 与用于扫描所提供文本的指定图像相对应的子区域的起始点 X 坐标 X2 是 数值 用于扫描所提供文本的子区域的结束点 X 坐标 Y1 是 数值 与用于扫描所提供文本的指定图像相对应的子区域的起始点 Y 坐标 Y2 是 数值 用于扫描所提供文本的子区域的结束点 Y 坐标 X2 是 数值 与用于扫描所提供文本的指定图像相对应的子区域的结束点 X 坐标 Y2 是 数值 与用于扫描所提供文本的指定图像相对应的子区域的结束点 Y 坐标 Windows OCR 语言 不可用 中文(简体)、中文(繁体)、捷克语、丹麦语、荷兰语、英语、芬兰语、法语、德语、希腊语、匈牙利语、意大利语、日语、韩语、挪威语、波兰语、葡萄牙语、罗马尼亚语、俄语、塞尔维亚语(西里尔文)、塞尔维亚语(拉丁语)、斯洛伐克语、西班牙语、瑞典语、土耳其语 英语 Windows OCR 引擎检测到的文本语言 Use other language 不可用 布尔值 False 指定是否使用“Tesseract 语言”字段中未提供的语言 Tesseract language 不可用 英语、德语、西班牙语、法语、意大利语 英语 Tesseract 引擎检测到的文本语言 Language abbreviation 否 文本值 所用语言的 Tesseract 缩写。 例如,如果数据是“eng.traineddata”,则将此参数设置为“eng” Language data path 否 文本值 保存指定语言 Tesseract 数据的文件夹路径 Image width multiplier 否 数值 1 图像的宽度倍数 图像高度倍数 否 数值 1 图像的高度倍数 图像匹配算法 不适用 基本、高级 基本 搜索图像时要使用的图像算法 失败,出现超时错误 不适用 布尔值 False 指定是希望操作无限期等待还是在设定的时间段后失败

备注

Power Automate 的正则表达式引擎是 .NET。 要查找有关正则表达式的详细信息,请转到正则表达式语言 - 快速参考。 OCR 引擎变量选项已计划弃用。 生成的变量 参数 类型​​ 说明 LocationOfTextFoundX 数值 文本显示在屏幕上的相应点的 X 坐标。 如果搜索在前景窗口中执行,返回的坐标与窗口的左上角相对应 LocationOfTextFoundY 数值 文本显示在屏幕上的相应点的 X 坐标。 如果搜索在前景窗口中执行,返回的坐标与窗口的左上角相对应 异常 例外 说明 如果文本处于非交互模式,则无法进行检查 指示在非交互模式中无法检查屏幕上的文本 子区域坐标无效 指示指定的子区域坐标无效 未能使用 OCR 分析文本 指示尝试使用 OCR 分析文本时出错 未能创建 OCR 引擎 指示尝试创建 OCR 引擎时出错 数据路径文件夹不存在 指示为语言数据指定的文件夹不存在 计算机上未安装所选的 Windows 语言包 指示机器上尚未安装所选的 Windows 语言包 OCR 引擎不活动 指示 OCR 引擎未处于活动状态 超时错误 指示操作在设置时间段后失败 使用 OCR 提取文本

使用给定的 OCR 引擎从给定源提取文本。

输入参数 参数 可选 接受 默认值 说明 OCR engine 否 Windows OCR 引擎、Tesseract 引擎、OCR 引擎变量 OCR engine variable 要使用的 OCR 引擎类型。 选择预配置的 OCR 引擎或设置新引擎 OCR 引擎变量 否 OCREngineObject 用于执行 OCR 操作的引擎 OCR source 不适用 屏幕、前景窗口、磁盘上的图像 屏幕 对其执行 OCR 操作的图像源 Image file path 否 文件 对其执行 OCR 操作的图像路径 Search mode 不适用 整个指定源、仅限特定子区域、与图像相关的子区域 整个指定源 OCR 操作的选定模式 图像 否 图像列表 用于将扫描范围缩小至与指定图像相关的子区域的图像 Tolerance 是 数值 10 指定图像可与最初选择的图像存在的区别程度 X1 是 数值 用于缩小扫描范围的子区域的起始点 X 坐标 X2 是 数值 用于缩小扫描范围的子区域的结束点 X 坐标 Y1 是 数值 用于缩小扫描范围的子区域的起始点 Y 坐标 Y2 是 数值 用于缩小扫描范围的子区域的结束点 Y 坐标 Windows OCR 语言 不可用 中文(简体)、中文(繁体)、捷克语、丹麦语、荷兰语、英语、芬兰语、法语、德语、希腊语、匈牙利语、意大利语、日语、韩语、挪威语、波兰语、葡萄牙语、罗马尼亚语、俄语、塞尔维亚语(西里尔文)、塞尔维亚语(拉丁语)、斯洛伐克语、西班牙语、瑞典语、土耳其语 英语 Windows OCR 引擎检测到的文本语言 Use other language 不可用 布尔值 False 指定是否使用“Tesseract 语言”字段中未提供的语言 Tesseract language 不可用 英语、德语、西班牙语、法语、意大利语 英语 Tesseract 引擎检测到的文本语言 Language abbreviation 否 文本值 所用语言的 Tesseract 缩写。 例如,如果数据是“eng.traineddata”,则将此参数设置为“eng” Language data path 否 文本值 保存指定语言 Tesseract 数据的文件夹路径 Image width multiplier 否 数值 1 图像的宽度倍数 Image height multiplier 否 数值 1 图像的高度倍数 等待图像显示 不适用 布尔值 True 指定是否等待图像显示在屏幕或前景窗口上 超时 否 数值 5 指定在操作失败之前等待操作完成的时间 图像匹配算法 不适用 基本、高级 基本 搜索图像时要使用的图像算法

备注

OCR 引擎变量选项已计划弃用。

生成的变量 参数 类型​​ 说明 OcrText 文本值 提取文本后的结果 异常 例外 描述 未能使用 OCR 提取文本 指示尝试使用 OCR 从给定源提取文本时出错 找不到图像文件 指示给定的路径中不存在文件 找不到地标图像 指示地标图像不存在 在非交互模式下无法从屏幕中获取文本 指示在非交互模式下无法从屏幕中获取文本 未能创建 OCR 引擎 指示尝试创建 OCR 引擎时出错 数据路径文件夹不存在 指示为语言数据指定的文件夹不存在 计算机上未安装所选的 Windows 语言包 指示机器上尚未安装所选的 Windows 语言包 OCR 引擎不活动 指示 OCR 引擎未处于活动状态


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3